淺談主流 AI 服務體系與相關工具
最近因為接觸了 n8n,發現 Side Project 既有的服務(如 PostgreSQL)對我的情境來說太笨重,決定將整個架構重寫。
而且之前讓 AI 規劃的新架構也有很大的問題。雖然初步討論出了一個看似合理的版本,但過了兩天,我又再度推翻了 n8n 的方案,決定乾脆等假日再重新好好規劃。
就利用這幾天的沉澱期,開始反思目前我在各家 AI 工具的實際使用情境。
主流 AI 服務體系
目前市面上主流的 AI 閉源模型供應商,主要是 OpenAI、Anthropic 和 Google 三家。在基礎功能上(問答聊天、多模態輸入、連網搜尋等),三家都已相當完善。
各家服務目前大致上都會有三個體系,每個體系的計費方式與資料隱私預設不同:
- 開發者體系:以 API Key 為主,按用量計費,適合程式整合與自動化流程。各家 API 資料預設不會用於訓練模型,Google AI Studio 免費方案為例外(詳見下方 Google 章節)。
- 企業與團隊體系:提供統一帳戶管理、用量配額控管與進階 SLA 保障,通常採合約報價,且資料契約明文禁止用於訓練。
- 消費者體系:分為免費方案與訂閱制,訂閱後可使用更強的模型或更高的使用額度。Web 對話資料預設可能用於訓練,各家都有提供設定可以關閉。
OpenAI 體系
起步最早,靠著串接各種外部工具和廣受喜愛的 GPTs,建立了龐大的應用生態,通常是大眾第一次接觸 AI 或考慮訂閱時最先想到的。
OpenAI 是我最早接觸的 AI 服務,但目前是三家裡面唯一沒有真正訂閱過的,所以這邊僅作概覽。訂閱方案分為 GO、Plus 和 Pro 三個等級,API 用量(開發者體系)與網頁版訂閱(消費者體系)完全分開計費。
主要工具:
- ChatGPT (Web/App) 是最主要的對話介面,內建 Canvas 功能,可在對話旁開獨立視窗直接編輯文件或程式碼。
- GPTs 可快速建立客製化機器人,支援串接外部 API (Actions),適合嵌進自動化工作流程。
- GPT Image 1(文字生圖)內建在對話中,連免費用戶皆可使用。
- Sora(影片生成)目前僅限內建在 Plus / Pro 等付費方案中。
Anthropic 體系
不走包山包海的功能路線,將所有技能樹都點在「寫程式與長文邏輯推理」等特定領域,沒有圖片生成、沒有影片生成等功能。客群因此出現了有趣的斷層:在開發者社群中聲量極高,早已有許多人訂閱或透過 API 串接;但在一般公司(包含軟體公司),比較少人訂閱(還是因為太貴了?),有人甚至沒聽過,依然只知道 ChatGPT。
Claude 的產品線是三家中最少的,開發者體系透過 Anthropic Console 取得 API Key,採 Pay-as-you-go 計費。消費者體系對個人用戶分為 Pro / Max 兩種訂閱級別。
要注意 Claude 的 Token 計算與限制機制和其他家不太一樣:免費版的額度極小,且如果單一對話拉得太長,會被強制要求「開啟新對話」才能繼續。雖然付費訂閱版沒有這個長度硬限制,但由於 Claude 在回覆時會把「整串歷史對話」一起計入 Context Window,所以對話越長,每次問答消耗的 Token 就越龐大,你的每日額度就會燒得越快。另外「Claude Code 與網頁版共用額度」也比較容易踩坑,去年 12 月底,我就曾因大量使用 Claude Code 測試,結果網頁版也跟著無法使用。
Claude 常見工具總覽
Claude (Web/App):主要的對話介面。
Claude Code 專為開發者打造的 CLI AI Agent 工具。能直接在終端機或 IDE 中運行,自動讀取本地端 Codebase、執行 Shell 指令、修復 Bug、建立 PR,並支援 MCP (Model Context Protocol) 來串接外部工具。目前延伸出兩種使用模式:
- Claude Code on Web:瀏覽器介面,連接 GitHub 帳號後,會把 Repository Clone 到 Anthropic 管理的雲端 VM 上執行,適合不想在本機安裝環境的情境。
- Claude Code on desktop:整合在官方 Desktop App 中,提供圖形化操作介面,包含視覺化的 Diff 比對、App 即時預覽,以及同時執行多個本地或遠端 Session 的能力。
Claude Cowork 官方 Desktop App 針對付費用戶推出的代理人(Agent)預覽功能,讓 Claude 能直接存取本機檔案並處理複雜、需要多個步驟的任務。
Artifacts Claude Web/App 內建的即時預覽功能。請它寫程式、製作網頁或撰寫長篇報告時,對話框旁會展開一個獨立的預覽視窗,可以直接看到渲染結果或一鍵複製整份乾淨的內容。這功能解決了傳統網頁版對話介面幾個惱人的問題:
- 程式碼區塊若包在其他 Markdown 區塊裡,一旦巢狀超過限制就會截斷,後面的內容跑到區塊外面。
- 用滑鼠直接框選對話複製,貼上之後排版全毀。
- 點對話的「複製」按鈕,會把 AI 打招呼的那些廢話也一起帶走,還得手動清掉。
Google 體系
擁有海量資源與跨平台整合能力,功能線極度龐雜。早期市場關注度相對低,但去年底 ChatGPT 5 表現未達預期,Google 順勢推出 Gemini 3.0 Pro,搭配手機綑綁訂閱、半價優惠及全家桶方案,成功吸引大批使用者轉向訂閱。
雖說各家 AI 都有訓練資料落後的問題,但因為 Google 的產品線實在太龐雜,常常會有「自家人不認識自家人」的狀況:有時連 Gemini 本身都搞不清楚自家有哪些可用服務。例如,詢問 Antigravity 相關問題時它完全不知道有這個工具;NotebookLM 明明去年中已支援中文 Podcast,今年 1 月詢問時它卻回覆說還不支援。這種情況在 Google 體系中感受格外強烈。
1. 開發者體系 (Google AI)
主要透過 Google AI Studio 提供服務。
- 提供開發者免費的 API Key,但有 RPM(每分鐘請求數)等額度限制。
- 可以綁定信用卡轉為 Pay-as-you-go,用多少付多少。
WARNING
注意:免費版的 API Key 資料預設會被 Google 拿去訓練基礎模型。升級為付費版後才會自動關閉,若在意隱私務必確認這點。
2. 企業級體系 (Google Cloud / Vertex AI)
架設在 GCP (Google Cloud Platform) 之上的 Vertex AI。
- 專門針對企業用戶,提供完整的 MLOps 工具鏈。
- 沒有免費額度,完全依據 GCP 資源和 API 使用量來計費。
3. 消費者體系 (Google One)
Google One 早期單純就是「訂閱雲端空間」,後來為了推廣 AI,才加入了包含 Gemini 服務的訂閱方案。
- 關於訂閱方案:最早期有包含 Gemini Advanced 的訂閱方案是 Google One AI Premium,後來拆分了 Plus(今年增加)/Pro/Ultra 三個等級。
- Gemini Advanced 是什麼?
- 很多人會把 Google One 訂閱和 Gemini Advanced 搞混。簡單來說,Google One 是你的「付費訂閱方案名稱」,而 Gemini Advanced 是付費後解鎖的「進階版網頁介面與服務」。
- 在 Gemini Advanced 模式下,才能呼叫 Google 較高階的模型(例如 Gemini 3.1 Pro),享有更寬鬆的對話限制和更長的上下文記憶。
- 家庭共享與「AI 點數 (AI Points)」:
- Google One 可以開家庭群組給 6 個人(含自己)用。
- 大部分的軟體權益(像是每個人的 Gemini 對話額度)都是帳號獨立分開的。所以有些人會自己開 6 個帳號組家庭,當主帳號額度耗盡時,就切換其他帳號繼續用。
- 但要注意:「雲端空間」和「AI 點數」是全家共用的! 也無法單獨限制個別成員的用量。
- AI 點數通常是在執行耗費龐大算力的生成任務時會消耗,例如用 Imagen 4 產高畫質圖片或生成影片等。
TIP
現在 AI 點數也可用於 Antigravity 的模型呼叫額度,只是 Pro 等級贈送的每月 1000 點 能增加幾次呼叫,我滿懷疑的。
Google 常見工具總覽
Google 把 Gemini 塞進了超多產品裡,這邊整理一些常見的工具和使用心得:
日常對話與開發輔助
- Gemini App(含 Gemini Advanced)
- 大家最常接觸的入口,有網頁版和手機 App。它是萬用功能載體,什麼都能做一點,用起來很方便;但要精細處理特定任務時,建議還是直接找專屬的工具。
- Gemini Code Assist & Gemini CLI
- Gemini Code Assist:IDE 擴充工具。老實說用起來有點尷尬,在 VS Code 裡,大部分人還是習慣用 GitHub Copilot 體系。可能客群在其他編譯器。
- Gemini CLI:終端機上的指令介面,可以設定連接 Gemini App、Google AI Studio 或 Vertex AI 的帳戶。
- 定位:如果有在用像 Antigravity 這樣的代理編輯器,可能會覺得原廠的 CLI 或 Assist 沒那麼好用。不過如果是簡單、重複性高的大量任務,還是可以丟給 Gemini CLI 處理來節省主力的額度。
辦公與知識管理
- NotebookLM 主要有兩個應用場景:
- 文件摘要與簡報生成
- 很適合行政或 PM 的工具。可以把會議記錄、長篇文件丟進去當作「資料來源」,讓它幫忙整理重點跟大綱。
- 最新版本可以用指令請它編輯 PPT,甚至下載 .pptx 檔案(以前只能匯出 PPT 排版的 PDF)。
- 缺點與限制:
- 產生 PPT 單次最高只支援 15 頁。
- 突破限制的方法:先請 AI 針對全部內容寫出一份完整的「PPT 大綱與分頁內容」。接著,將每 15 頁的逐字稿內容,單獨建立成一個新的「資料來源」。然後只勾選某一個局部的資料來源,請它生成 PPT,最後手動用 PowerPoint 把這幾份 .pptx 合併起來。只要維持給每個來源的提示詞(如版型、語氣)一致,確實能產出超過 15 頁且風格相近的簡報。
- 產生的簡報右下角會帶有 NotebookLM 的浮水印(通常非 Ultra 訂閱用戶都會被強制壓上)。
- 移除方式:匯出的
.pptx浮水印經常是「嵌死」在圖片上(直接跟背景圖壓扁在一起),無法在 PowerPoint 裡獨立選取刪除。目前社群常見的解法有兩種:一是把檔案丟進 Canva,利用 Canva Pro(Pro 要錢)內建的「魔術橡皮擦 (Magic Eraser)」功能將浮水印塗掉(或自己疊加圖形遮擋);二是使用網路上專門對付它的 AI 去背/去浮水印工具 NotebookLM Watermark Remover。
- 移除方式:匯出的
- 產生的簡報內文字會變成不可點選編輯的圖片。
- 解決方案:目前社群常用免費工具是 DeckEdit。它可以將 NotebookLM 產生出來的簡報(包含被轉成圖片的版面與 Nano Banana Pro 生成的重點插圖),還原成「可直接編輯文字」的 PPTX / PDF 格式。
- 產生 PPT 單次最高只支援 15 頁。
- 個人知識庫
- 缺點:來源管理不太直覺。 雖然很適合作為長期累積的知識庫,但因為管理不便,多半還是被拿來當單次的文件摘要工具。
- 來源內容變動時:若是本機檔案,必須刪掉舊的重新上傳;若是 Google 雲端硬碟檔案,雖然支援連動,但它不會在清單列表自動顯示更新,必須手動點擊來源觸發同步。
- Podcast 音訊生成 (Audio Overview):可以把文件轉成一男一女聊天的廣播節目。個人覺得實用度見仁見智,因為資訊密度偏低,比較偏向展現語音生動性。
- 文件摘要與簡報生成
影像生成與線上代理人
- Google Labs (AI Test Kitchen)
- 這裡通常放置 Google 最新實驗性工具。這裡近期經歷了大改版:以前 ImageFX (生圖)、Flow (生影片)、MusicFX (音樂) 是分開的介面,現在官方將生圖和修圖等核心功能整併進了 New Flow 裡,讓大家可以在同一個介面完成「生圖 -> 修圖 -> 影片生成」的一條龍作業。
- 想玩,但目前還找不到情境使用,這類實驗性影音功能通常也是消耗「AI 點數」的主力。
- Jules (線上程式代理人)
- 是一個在背景運行的 AI 代理。你丟給它任務或 Issue,它會自己開分支寫 Code,甚至發 PR 讓你做 Code Review。
- 缺點:
- 底層用的是 Gemini,不太適合寫複雜專案。
- 如果你在意 Git Commit Message 格式,它似乎只能「疊加」訊息,如果產生訊息不滿意,合併 PR 時得用 Squash and Merge 手動改寫。
- 因為是非互動式的,需求必須寫得很精確。像我之前測試,指令太籠統,又無法隨時對話修正,結果把專案改得很亂。
- 不過如果專案不複雜,找些簡單的任務給它練練手,順便練習自己寫需求規格和 Review 的能力,倒也是個不錯的選擇。
其他
- 幾乎所有 Google Workspace 服務(Docs、Gmail、Drive 等)都已經或正在整合 Gemini 附加元件了。
Google 生態小結
在免費的額度使用上,Google 是最大方的。Google 各階方案主要的差異還是在於 使用次數(或 AI 點數)」、「能呼叫的底層模型等級」 和 隱私權設定等。
我雖然之前有和一些非工程師的朋友推薦 Gemini,但不是看它寫程式的能力,日常對話雖然很夠用,但遇到複雜的 DevOps 或後端架構任務時,明顯不如其他家對手。不過,Gemini 生態最大的優勢在於「全家桶」綁定與多元的 UI 載體。它無縫整合了 Workspace 辦公軟體,還提供 Gemini App、NotebookLM、ImageFX、Jules 等各種介面,最重要的是不同平台的額度機制是分開算的。這種「東邊額度用完換西邊」的玩法,才是它目前最物超所值的地方。
網頁版對話介面與模型使用體感
不管是哪一家,大部分人最常接觸的都是 Web/App 的對話介面,也是最能直觀感受各家「模型性格」的管道。以下只是個人感想,不一定符合真實情況。
模型對話性格
TIP
以下以 GPT‑5.2、Claude 4.5、Gemini 3.1 為基準,GPT‑5.3 Instant (3 月 4 號出)與 GPT‑5.4 (3 月 5 號出) 剛出,尚未累積足夠使用心得。
- ChatGPT(容易自說自話): 建議透過系統指令把預設的熱情程度調低,否則它常會針對同一件事從多個角度重複說廢話。整體感覺是個自說自話的人,容易忽略使用者給的情境或定義,按照自己的理解做回覆;網路上也有不少人反映它常常沒辦法正面回答問題,必須來回對話幾次才會進入狀況。
- Claude(中立過頭就沒立場): 討論程式架構這類技術問題時,Claude 其實還蠻有條理的;但一旦延伸到比較偏軟性、沒有明確對錯的話題,「沒立場」的感受就特別明顯。在 4.5 版時,最典型的問題是:只要你補充一個新資訊,它就立刻改變立場迎合你,每次遇到都會覺得煩;如果給的上下文不夠充足,它又會進入「敷衍模式」,不斷總結你說的話,等到了解你的傾向後才開始正式回應——某種程度來說,這種說話方式跟我有點像。當它知道該表達什麼的時候,廢話又非常多。不過到了 4.6 版,廢話很多的情況改善不少,回覆精簡許多,至於其他問題,我就沒去驗證了。
- Gemini(表現慾過盛的又太有自信): 一開始以為它比 Claude 有立場,但後來發現它只是「表現慾很強」,很像是想被人誇獎一樣(這邊是指語氣感覺,不是指它真的想被誇獎)。最典型的情境是修 Bug 時,常常都自信滿滿地宣告「我做了什麼修改、說明為什麼這次絕對能成功」,結果執行下去不但還是錯,有時甚至錯誤還一模一樣。
各家模型對彼此的認知
我是真的很想吐槽,明明這三家最近都更新了好幾次模型,但它們對彼此最新版本的認知卻總是停留在過去,目前的測試結果大概如下:
| 提問對象 | 認為的 ChatGPT 最新版 | 認為的 Claude 最新版 | 認為的 Gemini 最新版 |
|---|---|---|---|
| ChatGPT | 5 | 3.7 | 2 |
| Claude | 4.5 | 4.6 | 2.5 |
| Gemini Pro | 4.5 | 3.5 | 3.1 |
(註:有趣的是,Gemini Flash 的訓練資料反而是最新的;另外,Antigravity 目前依然不在 Gemini 模型的訓練資料中。)
像我有時候在請 AI 幫我把筆記潤稿時,稍微沒盯緊,它可能就會把筆記裡正確的版號偷偷「降級」回它認知的舊版,這情況在修改 compose.yml 的 Docker Image 版本時也經常遇到。
Gemini 模型使用體感的補充
以下是幾個在實際使用中特別有感的問題,不限定於網頁版或 Agent,而是 Gemini 模型本身的行為:
校稿風格很難調教: Gemini 在校稿這件事上特別讓人頭痛。要不是把內容改得過度精簡、語氣公式化(它的說法是「專業」);要不是叫它改口語一點,結果充斥大量譬喻和浮誇用語,什麼「神兵利器」、「大幅提升」、「極度高效」、「最佳實踐」、「全方位解析」;等你告訴它只需要重新編排、不要刪除資訊,它又變得不太敢改任何東西。反觀 Claude 模型,可以在保留原本語氣和原意的情況下,針對編排進行調整,體驗差距相當明顯。
回應速度與穩定性: 老實說,我感受不太到模型的提升,回答速度反而越來越慢。在 Antigravity 用 Gemini Pro 時,有時卡住中斷後詢問目前狀況,它又卡了好幾分鐘才回應;換成 Claude 則是很快回覆,對比差距很明顯。
嚴重異常事件: 3 月 3 日晚上 ~ 3月 4 日凌晨曾出現嚴重異常:不管是 Gemini App 還是 Antigravity,都莫名其妙把思考過程一起輸出,仔細看內容竟然包含其他使用者的個人資料,或大量和自己問答完全無關的內容,感覺像是把別人的內容輸出到自己的對話裡。社群上也有其他人反映類似情況,相關討論:Threads @freakyketz、Threads @hiphop3535。
給連結的詭異邏輯: Gemini 不知為何常常不直接給網站連結,而是給 Google 搜尋連結。曾請它校稿文章,結果它把本地圖片的相對路徑全都改成 Google 搜尋連結格式…。
輸出完整性不穩定: Gemini 擅長消化長篇背景資料,但在主動輸出的「完整性」上,體感明顯弱於其他模型。以 Antigravity 的 Planning 模式為例,執行前會先產出完整的執行計畫;但若在計畫過程中來回討論與微調,後續重新產生的版本往往會悄悄遺漏原本已確認的細節,而不是在原有基礎上增修。提醒它補回時,若沒逐項明確指定,通常只能部分恢復,甚至以摘要版取代原先的完整描述。這個傾向不限載體,網頁版和 CLI 也可能發生(背後的通用機制另見下方「模型注意力的通用觀察」)。
另外,需注意 Antigravity 的 Implementation Plan 副本數量有限(約 20 個),迭代次數一多,舊版的正確內容可能因版本覆蓋而永久遺失。交辦編輯任務時,建議明確限定修改範圍,避免它在未被要求的區域一併「優化」,原始意圖很容易在反覆迭代中慢慢流失。
模型注意力的通用觀察
以下不限定網頁版或 Agent 編輯器,而是所有 AI 對話都可能遇到的情況:
- 上下文窗口大 ≠ 關注能力強:很多模型號稱超大 Context Window,但這和「能持續關注整段對話」是兩回事。就像我們平常在講話時,好幾輪前的話題可能還記得,但在最新一輪突然提及,不一定能馬上反應過來在講什麼。
- 過度聚焦導致鑽牛角尖:當 AI 花大量時間處理同一個問題,那個問題在模型的注意力權重會變很高,然後就一直卡在那邊。例如我曾遇過容器 image 升版後,設定有些不同,當時情況,正確做法是直接套用已規劃好的密碼,但 AI 第一時間是選擇設定開發模式。也遇過找的方向錯誤,已經給予提醒,並說明它哪邊認知錯誤,但它始終認為是我不懂,一直鑽牛角尖。
- 反覆迭代容易遺漏前段細節:在長對話中多次要求模型修改或重新產出同一份文件時,常會發現輸出內容「越改越短」,原本確認過的細節悄悄消失。這是長上下文模型的普遍限制:對話越長、需同時維持的條件越多,模型對前段資訊的提取能力會逐漸衰退,傾向優先服務最近的指令,前段細節容易被輕描淡寫帶過。實務對策是:重新生成前,將必須保留的關鍵段落明確複述一次,或限定模型只能修改特定範圍,避免全文重寫。
檔案上傳的隱形地雷
上傳成功 ≠ 模型有讀到完整內容。
網頁版的檔案上傳其實有不少陷阱:
- 各家對上傳數量都有硬性限制。有趣的是,把檔案打包成 ZIP 時,沒付費的 ChatGPT 可以靠壓縮檔規避單次數量限制;但付費訂閱的 Gemini 卻依然嚴格檢查壓縮檔內的檔案數量,付費體驗反而不如人家的免費版。
- Gemini 網頁版的檔案解析機制不穩定。我曾發生過上傳一份 3500 行左右的 Markdown 檔案,對話時才發現模型只讀了開頭和結尾、中間憑空消失。根本原因是 Web 介面前端在解析附件時發生截斷,導致模型接收資訊不完整,反倒是把同份文字直接貼到對話框,就能完整讀到。今年 1 月也發生過從 Gem 建立的對話中,模型根本沒收到附件的情況。Gemini 當時說改用 Google AI Studio 上傳能避免這問題,但我沒有實際去驗證(讀大量內容的方式有很多,例如直接交給 Agent 編輯器處理,不一定要依賴 Web 介面)。
- 之前使用 ChatGPT 曾將一個專案壓縮成 ZIP 上傳,回答內容明顯和實際專案架構對不起來。追問後它才坦承「沒有讀取全部檔案」,要我把缺漏部分重新上傳(重點是回話語氣有種「對啊,我就是沒看全部」的理直氣壯感,完全不覺得自己有問題,有時候看了真的會有點情緒)。
聯網搜尋的實際運作方式
這一兩年各家網頁版對話介面都已支援聯網搜尋,但「聯網」的實際機制和大多數人想像的不太一樣:模型並不是直接去連你貼的網址,而是透過搜尋引擎去查找。 Gemini 用的是 Google Search,ChatGPT 目前用的是自家的 ChatGPT Search,Claude 則不確定。
各家聯網搜尋歷程
- Google (Gemini):本身就是做搜尋引擎起家,從 Bard 時代就具備最原生的 Web 存取能力。
- OpenAI (ChatGPT):2023 年 5 月以「Browse with Bing」功能向 Plus 用戶開放,7 月因可存取付費牆內容暫停,9 月重新上線。2024 年 7 月發布 SearchGPT 原型,10 月底正式整合入 ChatGPT,讓各方案用戶都能取得即時搜尋資訊。
- Anthropic (Claude):起步最晚,原生搜尋支援較慢,過去較依賴第三方工具串接。
這個機制會帶來幾個實務影響:
- 如果你的網站還沒被搜尋引擎收錄,Gemini 就會讀不到。例如我今年剛把筆記搬到 GitHub Pages,初期因為 Google 尚未收錄,就遇到了這個問題。若發現自家網站搜尋不到,記得到 Google Search Console 提交
sitemap.xml。 - 有加
robots.txt限制的網站,或 GitHub 本身(可能是授權疑慮),各家模型基本上也都讀不了。 - 遇到讀不到的情況,Gemini 有點讓我覺得很煩,它不想讓你知道讀不到,會開始針對網址資訊和對話上下文亂掰內容;追問後會道歉說「剛剛偷懶」,然後重新嘗試,但還是繼續亂回,有時回的內容還和上一輪差不多。
不過 Agent 編輯器(如 Antigravity、Copilot)沒有這個問題,因為它們通常是直接執行在你的本地開發環境(或雲端工作區)中,具有直接讀取專屬檔案系統的權限,或是能透過內建工具直接爬取網址內容。
客製化 AI 助理
目前各家都有客製化 AI 助理的功能:ChatGPT 的 GPTs、Gemini 的 Gem,以及 Claude 的 Project。三者都允許上傳資料和進行角色設定,但在功能完整度和使用門檻上各有差異:
- GPTs(ChatGPT):功能最完整,可以串接外部服務(Actions),是三者中最有彈性的。不過是付費功能;因為我主力從不在這,所以沒有訂閱過,也沒嘗試去 GPT Store 下載現有工具來玩。
- Project(Claude):同樣需要訂閱才能使用。從 Project 發起的對話由 Project 統一管理,方便整理對話。
- Gem(Gemini):沒訂閱也能使用,是三者中對免費用戶最友善的。但功能較基本,不支援分類管理,最多只是在發起新對話時顯示近期用哪個 Gem 建立的對話記錄。
Gem 最主要的用途是讓模型模擬特定視角或人格去思考問題,也可以在 Gem 裡設定 workflow 和輸出格式。至於最佳設定格式,網路上有人推薦 XML、YAML、Markdown 等不同版本,我個人是採用混合格式,但我也不確定是否是最佳實踐。
全域個人化設定(Personalization)
各家網頁版對話介面都提供「個人化設定(Personalization)」功能,可以預先寫好一些準則,讓 AI 的預設行為更貼近你的習慣。
這與客製化助理有個核心差異:客製化助理是針對特定領域或任務量身打造;個人化設定則是套用在所有一般對話的通用預設格式。Gem 在獨立運作時,通常會遮蔽全域設定,不受其影響。
關於 Prompt 策略的細節,為什麼規則太多會讓 AI 跑偏、正向引導和負向約束怎麼搭配,另外整理成一篇:Prompt 正向引導 vs 負向約束:從踩雷開始學。
AI Agent 編輯器
個人主要使用 Antigravity 和 GitHub Copilot 這兩套 Agent 編輯器。
Antigravity vs Copilot vs Gemini CLI
這三套工具的計費和使用習慣差異很大,搞清楚之後就很好分配用途:
- Antigravity:適合需要「來回對話討論」的任務。代理編輯器,可以讓它一邊寫 JavaScript 腳本操作網站,一邊修 Bug(但別太指望它能精準修復 CSS 排版問題)。以前用 Claude 模型開發非常好用,每 5 小時重置一次額度,但後來 Claude 加了週額度限制後就比較不夠用了(如果你是一人六化的家庭群組,當我沒說)。Gemini 模型可以拿來討論專案 Bug 找靈感,或是切 Claude 模型來寫計畫。
- GitHub Copilot:適合交辦「實作任務」。計費方式是一次對話問答算一次,不過不同模型會有不同的次數權重加成(輕量模型消耗少、高階模型消耗多)。因為不論是解答問題還是大量實作,次數單位是固定的,所以只要把迭代上限調高,將 Antigravity 討論完的執行計畫給 Copilot 開發,比讓 Antigravity 跑複雜任務、一下就燒光 Claude 模型額度更有效率。
- Gemini CLI:定位上有點尷尬,像是低配版的 Antigravity,又只能選 Gemini 模型,而 Gemini 用於寫程式或處理複雜任務都容易出錯。OAuth 模式和 Copilot 一樣算次數,但單次有 Token 上限。除非是簡單任務,或掛在背景整理一些專案文件,否則不太會用到。
Gemini 模型的腳本批次處理問題
Gemini 模型自己會傾向用腳本批次處理任務,這就帶來問題了:我們在交辦任務時,其實還是需要自行判斷這個需求「適不適合」用腳本處理。 不一定要想出實作細節,但基本邏輯能否推理出來,這點判斷力還是要有的。如果自己也沒把握,卻放任 Gemini 跑腳本,很有可能會把東西搞壞;即便它信誓旦旦說會用多嚴謹的正規表示式來處理,也不要輕易相信。而且一旦它決定用腳本,如果我們想要求它改為「逐一讀取每個檔案處理」,不論是 Antigravity 還是 Gemini CLI 都會相當抗拒,常常要來回拉扯幾次才甘願放棄腳本。
WARNING
自 2026-03-12 起,Google AI 調整了訂閱方案架構,Antigravity 的配額也隨之連動。官方公告原文如下:
We're evolving Google AI plans to give you more control over how you build. Every subscription includes built-in AI credits, which can now be used for Antigravity, giving you a seamless path to scale.
Google AI Pro is the home for the practical builder, hobbyists, students, and developers who live in the IDE and don't necessarily rely on an agent. This plan features generous limits for Gemini Flash, with a baseline quota included to "taste test" our most advanced premium models.
Google AI Ultra serves as the daily driver for those shipping at the highest scale who need consistent, high-volume access to our most complex models.
If you're on Pro but need "extra juice" for a heavy sprint or deeper access to premium models, simply top up your AI credits to customize your plan.
Keep building. Keep shipping.
簡單說,Pro 方案的定位是 Gemini Flash 為主力、進階模型(Gemini Pro、Claude)僅提供有限的試用配額;Ultra 才是需要高頻使用進階模型的方案;若 Pro 臨時需要更多額度,可單獨購買 AI Credits 補充。
對實際使用的影響:Gemini Pro 與 Claude 模型的配額大幅縮減,且改為**週額度(Weekly Quota)**重置。局面有些弔詭——Gemini CLI 作為定位較低階的載體,目前反而擁有相對寬裕的 Gemini Pro 額度;Antigravity 體驗雖佳,但進階模型的週配額十分有限,性價比優勢明顯削弱。
由於此機制仍可能持續調整,後續不再追蹤補充。
我一直是 Visual Studio 的重度依賴者,只有在寫非 .NET 專案時才會開 VS Code。所以一開始,我是直接在 Visual Studio 裡使用 Copilot,但當時的體驗感覺非常難用;直到過年期間我才搞懂,原來 Visual Studio 裡預設的 Copilot 對話介面根本不是 Agent 模式,想獲得 Agent 功能,必須另外手動切換模式才行。
而以 Agent 功能的完整度排序,三種介面大概是 Copilot CLI > VS Code > Visual Studio。Copilot CLI 的設定選項最多,彈性最高;VS Code 次之,介面順手、擴充也方便;Visual Studio 雖然官方說法是「在 .NET 專案中深度優化」,但我個人體感反而是 Agent 功能相對受限,你得到的不是加分項,更像是因為 .NET 綁定而換來的取捨。近期 VS Code 的公告持續把 CLI 的一些功能回饋進來,差距慢慢在縮小(參考 VS Code 2026 年 2 月版(1.110))。
TIP
不過如果我自己在改 .NET 專案 還是會用 Visual Studio,具體來說是看這個任務是以為我主,還是以 Agent 為主開發,前者使用 Visual Studio,後者用 Copilot CLI 或是 Visual Studio Code。
WARNING
在 WSL 環境(如 Ubuntu)使用 Copilot,建議優先選擇 VS Code。Copilot CLI 目前在需要執行腳本時依賴 PowerShell,而 WSL 預設通常未安裝;一旦遇到需要 PowerShell 的操作,Agent 不會自動改用 bash,而是會要求你手動執行指令後再把結果回報給它,嚴重影響自動化流程的連貫性。
Agent 的上下文管理
使用 Agent 時,建立適當的規則檔和上下文文件非常重要。幾個實際觀察:
- 沒有規則檔,AI 每次都在踩同一個雷:有些臨時任務懶得建
AGENTS.md之類的檔案,結果 Agent 每次執行都把相同的地雷重踩一遍,浪費大量時間才開始正式進入任務。 - 跨工作區的上下文感知(已失效?):我記得以前在使用 Antigravity 時,如果在 A 和 B 兩個不同工作區分別開了視窗,A 視窗的對話能感知並讀取到 B 視窗「當前開啟中的檔案內容」。但最近使用時,這個「跨工作區讀取」的能力似乎辦不到了,各個專案視窗的上下文變得完全隔離。猜測可能是因為隱私安全(怕誤傳別處的機密代碼)或 Token 成本的考量,這種全域收集的機制被原廠給修掉了。
- 對話過長會卡死:Antigravity 一次對話講太長就會卡住,強制要求開新對話,但這時要即時壓縮對話內容傳給新對話往往也來不及。
個人取捨與後記
Gemini Pro 3 在去年 12 月用起來其實很不錯,很多去年上半年各家 AI 都答錯的問題它都答對了。但現在越用越覺得越來越差,也說不清楚是它真的退步了,還是各家模型都在進步、導致自己的評判標準也跟著提高(最近和 Gemini 聊到生氣的頻率也越來越高)。目前最大的期望只有一個:希望下一版能做到「不知道就說不知道」,不要老是假裝自己什麼都知道。
模型選擇上,我一直認為 Claude 是寫程式最好的模型;Claude 升級到 4.6 後也有點心動想重新訂閱。不過想了想,當初訂閱的想法是一個用來寫程式,一個用在其他領域。寫程式這塊已經有 Copilot 扛著,Claude 在工程以外的情境也沒有特別突出,所以目前就用免費額度偶爾討論事情就好,暫時不打算重新訂閱。
高階的 Claude Opus 4.6 成本也比較高;而 Sonnet 4.6 和 GPT-5.3 Codex 在 Copilot 的次數權重都是 1,目前社群有人認為在「寫程式 Agent(自動代理)」的實際體驗上,GPT-5.3 Codex 反而表現比較好。例如保哥曾提到:寫文件、做計畫用 Claude Opus 4.6,寫程式、做開發用 GPT-5.3 Codex(現在最新是 5.4),寫網頁、做設計用 Gemini 3.1 Pro。
不過我發現,我現在已經變成 AI 重度依賴者。想建立新東西時,目前的開發流程大概會是這樣:
- 將收集的資訊、想法與初步討論紀錄,丟給 Antigravity 產生雛型方案。
- 根據方案查閱資料,建立自己的心智模型,然後與 AI 一起迭代整份計畫。
- 最後將實際開發工作交給 Copilot。
正式加入不寫程式,只出一張嘴的 PM 行列。
異動歷程
- 2026-03-07 初版文件建立。
- 2026-03-13
- 補充 Google 於 2026-03-12 調整 Antigravity 配額機制的相關說明。
- 補充 Gemini 輸出完整性不穩定的問題與建議。
- 補充 Copilot CLI 在 WSL 環境的限制與規則檔讀取問題。
